iT邦幫忙

2022 iThome 鐵人賽

DAY 14
0
AI & Data

【30天之新手學習筆記】PyTorch系列 第 14

Day 14 - 自然語言處理(NLP)介紹及相關應用

  • 分享至 

  • xImage
  •  

自然語言處理是結合人工智慧和語言學兩個領域所發展出的學科,主要是在探討如何處理及運用自然語言,這裡我舉幾個例子,像是資料萃取語音辨識機器翻譯都是自然語言處理用來解決問題的.在自然語言處理中,文字與它的元資料會被稱為一個實例,而單一實例稱為文件,一群實例則稱為文集.將文件分解成一個一個較小的部分,這個過程被稱為標記化,過程中會產生標記,標記則是演算法能夠理解的含義單元.整個文集中所有標記的集合稱為詞彙.

程式語言 vs 自然語言

https://ithelp.ithome.com.tw/upload/images/20220927/20152671w8yY9KjIc3.jpg
程式語言簡單來說就是為了人類與電腦溝通而設計出來的人工語言,會因為應用目的會使用不一樣的程式語言,例如 C、Java、Python等.

自然語言中的自然這個詞是相對於人工語言來的自然,自然語言是人類彼此之間溝通而自然發展出的語言並且具有結構性的語法,自然語言處理的終極目標就是讓電腦能理解或運用人類語言.

文字標記化

"When life seems hard, the courageous do not lie down and accept defeat; instead, they are all the more determined to struggle for better future." -Elizabeth II

https://ithelp.ithome.com.tw/upload/images/20220927/20152671sIVx9y2ipJ.png

從文字產生n元语法(n-gram)

https://ithelp.ithome.com.tw/upload/images/20220927/20152671HYj2sO4rEP.png

詞形還原

https://ithelp.ithome.com.tw/upload/images/20220927/20152671og2UoVuyul.png

詞類標籤

https://ithelp.ithome.com.tw/upload/images/20220927/20152671C5mNGX19Yf.png

參考資料:


上一篇
Day 13 - 損失函式的實作
下一篇
Day 15 - 感知器(Perceptron)介紹與實作
系列文
【30天之新手學習筆記】PyTorch30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言